#AI Agent

因为我翻译过这位大佬几次,X就会推送 一贯的又快又有质量的评论,不是AI瞎分析 翻译: Anthropic 在打造类似 OpenClaw 这类产品上的推进速度,已经超过了 OpenAI。 OpenClaw 证明了一件整个 AI 行业一直在设想的事:真正理想的 AI Agent,不该只存在于云端,而应该直接运行在你的个人电脑上;同时,你还应当能够无论身在何处,都能远程调用它。 它在 GitHub 上拿下了 31.8 万星标,随后 Steinberger 加入 OpenAI,准备把这套思路产品化、规模化。 但从那之后,OpenAI 交出的成果并不算完整。Codex 只是一个桌面端编程代理,缺少手机远程操控能力;ChatGPT Agent 则运行在 OpenAI 云端的远程虚拟机里,根本看不到你电脑里的本地文件。 现在已经有开发者在 Codex 的 GitHub 仓库里公开提需求,希望实现“手机控制桌面代理”。而第三方开发者更是已经先行动手,做出了 Taskdex 和 Remote Codetrol,靠中继服务器和 Tailscale 隧道来弥补这个缺口。 Anthropic 则直接原生补上了这一块。 他们推出的 Dispatch,可以让你的手机与 Claude Desktop 配对,你无论身处何地都能给 Cowork 下达任务,回来时工作就已经做好了。 实际上,Cowork 本来就已经具备了一整套关键能力:在本机运行虚拟机、访问完整文件系统、操控浏览器、协调多个子代理,以及用 Markdown 管理技能系统。Dispatch 的意义就在于,它补齐了最后一环,让整套系统真正变成一个可以“装进口袋、随时调度”的个人 AI 工作平台。 这也是为什么它能做到云端 Agent 做不到的事:Cowork 直接面对的是你真实的电脑环境——你的文件、你的浏览器、你已经登录并连接好的工具都在那里。 比如我让它把本地表格和竞争对手网页上的定价做交叉比对,它能立刻完成,因为表格和浏览器都在同一台机器上。 换成云端 Agent,你往往得先上传文件,不但丢失原本的文件路径和上下文,甚至它依旧无法访问你本机中已经连接好的 Slack 或 Google Drive。 这里的关键不只是“能不能运行”,而是“上下文是否真实完整”,而本地机器天然拥有这种真实性。 我自己从 Cowork 发布起就一直在用。 每天早晨,在孩子醒来之前,我会先派发五项任务:研究简报、竞品分析、文件整理、从本地表格里提取数据,以及文稿润色。 原本需要 90 分钟亲自处理的工作,现在压缩成 10 分钟布置任务,再花 20 分钟审阅结果。 Dispatch 改变的不是某一个功能,而是整天的工作节奏:哪怕我人在外面,突然想到一件事,也能立刻用手机发给 Cowork,等回到家时,结果已经准备好了。 更让 OpenAI 难受的地方在于:Anthropic 根本不需要收购 OpenClaw,也不需要挖来 Steinberger,照样把这套东西做出来。 因为他们本来就已经在独立建设同样的架构。 早在 1 月 Cowork 上线时,它就已经具备本地虚拟机执行、文件系统访问和 Markdown 技能体系,而那时 OpenClaw 甚至还没真正火起来。 Steinberger 只是证明了市场需求存在,而 Anthropic 早就把对应的产品供给做好了。 换句话说,OpenAI 挖走了设计师,但真正的设计图,似乎早就留在 Anthropic 那边了。
Y11
4个月前
高端招聘:阿里 招 AI Agent技术架构师(P7-P8) ----- 阿里控股-AI Agent技术架构师-杭州 阿里集团 · 杭州 职位描述 1、参与阿里巴巴控股集团企业经营智能化方向产品的研发和核心模块的架构设计; 2、主导AI+各类型文件要素提取、结构化体系、审核能力,及对应AI Agent化的技术架构设计,具备高性能、高可用、高可扩展的特性; 3、结合各类型场景涉及到的文件类型,推进AI+文件结构化的类型覆盖与准确率保证工作; 4、参与制定长期技术路线图,推动 AI+文件要素提取在企业经营自动化场景及机器审核等各类场景的支持落地; 职位要求 1、5 年以上后端开发经验,主导过企业级 AI 产品的架构设计; 2、有较强的逻辑能力和规划能力,对 AI Agent 有深度的了解和实践经验; 对前沿技术有好奇心,对 AI 技术发展方向有预判能力; 3、具备较强的自驱力,追求卓越,善于沟通,善于跨团队协作推进事项; 能够推动传统应用架构、基础 Agent 架构向前沿的 AI 应用架构发展和破局; 4、有扎实的后端基础,有大型项目的工程实践经验,精通 Python 或 Java 中至少一门语言; 5、对 AI 应用和 AI 产品有深刻理解,了解大模型的使用边界具备 AI 产品的洞察能力; (加分项); 1、有 AI 领域业务和产品主导能力的优先; 2、有开源项目贡献经验、有 AI 相关专利或论文的优先; 3、深刻理解企业应用设计模式,有大型分布式,高并发,高负载,高可用性系统设计开发经验; 对复杂的服务端系统有构架、经验优化者优先; 4、具备技术团队管理经验者优先; 报名地址详见: 搜索。
0xTodd
4个月前
上次聊过的 Warden 主网正式上线了,这是一条 Cosmos SDK 做的 EVM 兼容链。 有些人可能会问,为什么做 AI Agent 的协议还是需要一条链呢? 在开始之前,想跟大家聊聊 AI 和 AI Agent 的区别究竟在哪? 很多人至今没搞清两者的区别,如果用一个比喻来说,AI 是一个只有大脑的顾问,AI Agent 则是配备了大脑、手脚和工具的员工。 上一代 LLM 基本都是只能算 AI 而不是 Agent,例如 Gemini 1.5 和 GPT-4。它们博学多才,逻辑清晰。但它没有手脚,没有眼睛(如果不接摄像头),不能操作电脑。 所以 AI 的交互是单向的:你问它问题,它给你答案,任务到此结束。 而 AI Agent 会干活。比如说,Warden AI Agent 商店里那些 AI Agent,你连上钱包之后,它真的能给你在 Uniswap 上交易、真的能去跨链。原因就是它有工具,例如浏览器、代码解释器、API 接口。 所以 AI Agent 的交互是闭环的:你给它一个目标,它自己去思考怎么做、去执行、最后给你结果。 比如说,这次测试了一个【定投】的 AI Agent,给它说完要按照每 5 分钟买一次 ETH,在钱包授权了一次之后,它就真的开始哼哧哼哧开始执行了。 PS:你公司聘的究竟是顾问,还是员工,这还是区别蛮大的。 但是像 Gemini 3 + Nano Banana 2 这种,定义界限就有点模糊了,你给它的绘画任务是能完成并交付的,应该算是介于 AI 和 AI Agent 之间。 话说回来,那么 Warden 为什么要专门发个链来做这事儿呢? 就拿刚才的定投例子来说,确实往 Warden 里充了一些钱,但是这个钱包也只能放点零钱,暂时是不敢放大资金的。 因为,如果你让一个在 AWS 服务器上运行的 AI 帮你“用 1000 USDT 买入以太坊”,你完全是在盲信这个服务器的管理员。 你不知道它是否真的按最优价格执行了,还是偷偷夹带了私货(MEV),甚至直接卷款跑路。 Warden 主网的作用,它通过链上共识来验证 AI 的推理结果。 Warden 有一种机制叫 SPEX(统计学执行证明)。 简单来说,它就是让多个节点同时运行或验证这个 AI 任务,链上节点会做随机抽查,并且匹配信誉证明。SPEX 机制相当于某种程度的预言机了。 只有长期得到信任的 AI Agent 大家才会授权给它更多资金,让它做更多事情。 另外,和众多项目上主网的原因一样,Warden 的代币 $Ward 也自然是主网的 GAS 代币以及 AI Agent 支付代币。